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jg X [目的 /意义 ]“ 数 字 人 文 奖 ” 是 国际 数字 人 文 领域 的 权威 奖项 之 一 ,通过 对 获奖 项 目的 梳理 分 析 , 可 以 发 现 数字 人 
文 领域 “优秀 项 目 ” 和 “实用 工具 ”的 共性 ,总 结 失败 项 目的 不 足 。|[ 方 法 /过 程 ] 利 用 文献 调研 法 、 内 容 分 析 法 和 信 


息 计量 梳理 “数字 人 文 奖 ” 历 年 获奖 项 目 , 归 纳 总 结 


获奖 项 目的 特点 和 不 足 。[ 结果 /结论 ] 提出 数字 人 文 的 工具 开 


= 发 应 以 代码 开源 和 用 户 需 求 为 导向 ;项 目 实践 应 以 关联 数据 国际 图 像 互 操作 框架 (TF)、 资 源 描述 框架 (RDF) 和 
> ALE SEC CAT) 28 3-XHBORAIEZR C AUTEUR GC TR AUR B TAR DHE” A RRRA, 
关键 


il: 数字 人 文 奖 工具 开发 ”技术 实现 最 小 计算 


忆 ) 近 年 来 数字 人 文 的 应 用 实践 如 火 如 禁 , 有 以 方志 
MEFS AIU ,中文 古籍 循 证 平台 为 代表 的 数据 基础 设 
旅 台 没 ;有 深度 学 习 模 型 .文本 挖 所 技术 、 知 识 图 谱 、 
GIS 竹 技术 在 语料库 的 应 用 ;有 对 以 “欧洲 时 光 机 "为 
代表 的 欧美 地 区 数字 人 文 实践 的 案例 分 析 ; 有 对 如 “ 数 
字数 条 “上 海 图 书馆 历史 文献 平台 "等 文化 遗产 资源 
的 锯 目 开发 。 学 者 们 习惯 从 文献 计量 角度 ,宏观 分 析 
数 室 人 文 领域 的 应 用 热点 ,他 们 有 以 下 共识 :语言 学 、 
艺术 学 和 史学 是 数字 人 文 的 主要 应 用 领域 ;数据 基础 
设施 的 建设 是 目前 数字 人 文 实践 的 热点 之 一 VR 
管 有 学 者 认为 当今 数字 人 文 的 发 展 偏向 应 用 与 实 
RE ,但 是 对 数字 人 文 项 目 实践 的 评价 和 总 结 却 很 少 。 

奖项 是 文化 生产 领域 内 一 种 重要 的 确认 形式 ,是 
对 领域 内 最 好 的 生产 实践 作品 的 认可 和 奖励 ,多 元 奖 
项 的 认定 更 是 能 够 推动 学 科 共同 体 的 建设 。 在 颁奖 相 
关 活 动 的 背后 ,是 大 量 资料 的 收集 和 数据 库 的 建立 ,如 
果 把 每 年 人 围 和 获奖 作品 资料 进行 比较 查看 ,可 作为 
该 领域 实践 发 展 的 一 种 “物证 "。 因 此 本 文 从 “数字 人 
文 奖 " 的 历年 获奖 项 目 信 手 , 对 数字 人 文 领域 的 应 用 实 
践 进行 分 析 总 结 , 从 中 罕 探 现状 和 探讨 趋势。 


1 相关 实践 调研 


20 世纪 90 年 代 ,信息 技术 和 人 文学 科 的 互动 下 诞 
生 的 新 兴学 术 领 域 “ 数 字 人 文 "逐渐 成 为 一 个 独立 学 
科 。 以 国际 数字 人 文 组 织 联盟 (The Alliance of Digital 
Humanities Organizations ,ADHO ) 为 代表 的 学 会 和 研究 
机 构 为 推进 数字 人 文 发 展 ,设置 了 很 多 奖项 如 表 1 所 
示 。 影 响 力 较 为 广泛 的 有 :ADHO 以 数字 人 文 先 驱 者 
罗 伯 托 : 布 萨 命名 的 布 萨 奖 (Roberto Busa Prize) ,被 视 
为 数字 人 文 领域 的 最 高 个 人 成 就 奖 ;美国 人 文 基 金 会 
NEH 设立 的 “数字 人 文 进步 奖 ” (Digital Humanities Ad- 
vancement Grants, DHAG) ,主要 资助 数字 人 文 项 目的 
实施 ;加 拿 大 数字 人 文学 会 (Canadian Society for Digital 
Humanities , CSDH/SCHN) 面向 本 国学 者 设立 的 一 系列 
奖项 ,如 “杰出 贡献 奖 ”( Outstanding Contribution A- 
ward ) 是 对 加 拿 大 籍 的 研究 人 员 在 数字 人 文 领 域 的 重 
大 贡献 的 认可 ;“ 数 字 人 文 奖 ”( Digital Humanities A- 
wards: Highlighting Resources in Digital Humanities, DH 
Awards) 是 一 个 开放 、 多 元 的 奖 , 以 表彰 全 球 数 字 人 文 
的 资源 、 工 具 和 专业 知识 ;美国 历史 协会 颁发 的 罗 伊 ， 
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等 . 数字 人 文 项 目 发 展 的 特色 和 建议 一 一 基于 对 国际 数字 人 文 获奖 


项 目的 Gna RT | 


罗 森 茨 威 格 数字 历史 创新 奖 (The Roy Rosenzweig Prize 
for Innovation in Digital History ) 旨 在 奖励 在 数字 历史 领 
域内 免费 .创新 的 新 媒体 项 目 。 

“数字 人 文 "作为 一 个 学 科 名 称 和 专业 术语 的 历 
程 并 不 长 ,因此 对 该 领域 的 奖项 研究 尚 处 空白 阶段 。 
调研 整理 的 奖项 如 表 1 所 示 , 大 部 分 奖项 以 表彰 研究 
人 员 或 对 项 目 提供 基金 资助 为 主 ,面向 项 目的 奖项 或 
是 局 限 在 特定 学 科 、 机 构 内 ,或 是 持续 时 间 短 ,不 能 完 


^ KEJU 


全 反映 数字 人 文 实践 的 历史 发 展 。 其 次 ,这 些 奖项 是 


由 专家 组 成 的 评委 会 进行 评审 , 专 委 会 的 评审 制度 虽 
然 保 证 奖项 的 专业 性 和 权威 性 ,但 受众 在 认可 数字 人 
文 的 学 者 范围 内 ,没有 积极 吸引 传统 人 文学 者 的 参与 ， 
达 不 到 “ 破 圈 ”的 效果 。 再 者 , 表 1 中 大 部 分 奖项 的 设 
置 较为 单一 ,围绕 人 文 资源 进行 的 数据 库 建设 程序 设 
计 、 可 视 化 呈现 .数字 期 刊 和 博客 发 布 并 非 传统 的 学 术 
活动 和 成 果 , 目 前 被 认定 或 转换 为 现 有 学 术 评价 体系 接 
受 的 学 术 成 果 较 为 困难 ,作为 新 兴学 科 的 数字 人 文 需要 
多 元 奖项 对 其 成 果 的 认可 和 宣传 ,吸引 更 多 的 关注 。 


R1 数字 人 文 领域 奖项 列表 


奖项 起 始 年 份 评选 对 象 说 明 
THEE - 布 萨 奖 (Roberto Busa 2002 年 至 今 (每 三 年 ) ”有 杰出 贡献 的 数字 人 文学 者 国际 数字 人 文 组 织 联 盟 ( ADHO ) 的 奖项 委员 会 SCA ffi 
Prize) [4] 责 奖 项 征集 和 评选 
安东尼 奥 . HAK (Antonio Zam- 2010 年 至 今 (每 三 年 ) ”在 重大 数字 人 文 项 目 中 有 杰出 
"polli Prize) [5] 贡献 的 学 者 
A XX (Digital Humanties A- 2012 年 至 今 数字 人 文 工 具 WH ,资源 .博客 ”志愿 者 组 成 的 国际 题名 委员 会 负责 审核 和 监督 ,大 众 通 
ards) 等 过 邮件 投票 评选 
E W D% (Succeed A- — 2013 -2014 年 数字 化 的 工具 Europeana 的 专业 评审 委员 会 ,表彰 利用 新 技术 的 数字 
| 化 项 目 
e. 美国 中 世纪 学 会 数字 人 文 与 ”2017 年 至 今 美国 中 世纪 研究 院内 的 学 者 美国 中 世纪 学 会 (MAA ) 颁发 
多 媒体 研究 奖 ) [7] 
yE 会 根据 MAA 对 项 目的 标准 选 2016 年 至 今 优秀 出 版 物 项 目 美国 研究 学 会 (The American Studies Association ,ASA ) 
奖项 目 Garfinkel 数字 人 文 奖 [8] 的 数字 人 文 小 组 负责 奖项 评选 
数字 人 文 奖 [9] 2015 -2018 年 数字 人 文 项 目 柏林 的 数字 人 文 会 议论 坛 让 | DH | b(2013 -2018) f 
责 颁 奖 , 会 议 组 委 会 负责 评选 
8 术 人 入 文 杰出 成 就 奖 / 杰 出 贡献 奖 / ”2014 年 至 今 拿 大 内 的 机 构 工 作 人 员 或 加 “加 拿 大 数字 人 文学 会 (CSDH ) 负责 奖项 评选 ,每 年 轮流 
早期 杰出 职业 奖 1101 os 颁发 
.NYCDH 研究 生 奖 11] 2014 年 至 今 纽约 州 地 区 的 研究 生 纽约 市 数字 人 文科 学 小 组 (NYC) 的 颁奖 委员 会 负责 项 
> 目 评审 
VG AGGER ODHAG) U?) 2010 年 至 今 项 目 资助 .奖学金 资助 美国 国家 人 文 基金 会 ( NEH) 负责 评审 
Edi Library labs AwardsL13] 2015 年 至 今 针对 大 英 图 书馆 的 数据 或 馆藏 ”大英 图 书馆 的 专家 和 馆 员 组 成 的 评委 会 
p 发 的 项 目 
n - 罗 森 茨 威 格 数字 历史 创新 “2009 年 至 今 数字 历史 的 创新 项 目 乔治 梅森 大 学 的 罗 森 茨 威 格 奖 基 金 会 提供 资助 ,美国 
3g Ua] 历史 学 会 (AHA ) 的 专家 委员 会 对 项 目 进行 评审 
数字 人 文 是 一 个 目标 驱动 型 的 研究 领域 ,实践 项 众 参 与 数字 人 文 社 群 ,提高 数字 人 文 意识 。“ 数 字 人 文 
目 丰 富 ,很 多 学 者 从 项 目 内 容 、 技 术 .主题 领域 等 角度 | 奖 "的 国际 学 术 委 员 会 负责 奖项 启动 和 监督 投票 ,成 员 


总 结 分 析 数 字 人 文 的 现状 和 需求 特征 。 
对 数字 人 文 年 会 内 容 的 整理 ,根据 项 目 对 应 
进行 梳理 分 类 。 徐 彤 阳 等 总 结 
文 项 目 概况 并 建立 评价 体系 ”。 韩 滞 哲 通过 对 国外 
o 目 介 绍 ,总 结 优秀 项 目的 特 

。 上 述 文献 的 聚 类 和 比较 分 析 以 地 区 或 会 议论 
文 为 样本 ,缺乏 全 球 不 同 地 区 的 横向 对 比 、 不 同时 间 的 
纵向 分 析 。 因 此 本 文选 择 了 “数字 人 文 奖 ” 的 获奖 项 
目 作 为 研究 对 象 ,整理 归纳 获奖 项 目的 内 容 特 征 , 为 数 
字 人 文 的 实践 提供 启示 。“ 数字 人 文 奖 ” (DH Awards) 
由 一 群 数字 人 文 爱好 者 于 2012 年 发 起 ,目的 是 为 了 宣 
传 和 表彰 数字 人 文 的 资源 、 项 目 和 知识 ,吸引 更 多 的 公 


"ERES I 
学 科 领 域 
了 澳大利亚 数字 人 


是 来 自 各 国 的 志愿 者 。 每 年 三 月 开始 征集 题名 ,国际 
委员 会 审核 题名 资源 是 否 属于 数字 人 文 领域 .是 否 本 
年 度 发 布 或 取得 重大 进展 ,并 将 资源 分 配 在 不 同类 别 
下 ,在 为 期 两 周 的 公开 投票 期 结束 后 ,在 其 网 站 上 公布 
每 个 类 别 的 冠 亚 季军 和 其 他 提名 资源 的 信息 。 

与 ADHO,CSDH 等 学 会 颁发 的 奖项 最 大 的 不 同 
是 “数字 人 文 奖 "的 优胜 作品 完全 由 公众 投票 决定 。 
从 “数字 人 文 奖 ”的 获奖 项 目 中 ,可 以 归纳 优秀 案例 
的 共性 ,从 中 突 探 人 文学 者 心中 “好 的 项 目 ”““ 实 用 的 
工具 ”和 “失败 的 教训 ”, 为 国内 数字 人 文 实践 提供 参 
考 。 
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2 “数字 人 文 奖 案例 论述 


“数字 人 文 奖 "常设 奖项 有 :最 佳 工具 "(Best DH 
Tool or Suite of Tools) ) “最 佳 可 视 化 ”(Best DH Data 
Visualization) “最 佳 博文 ”(Best DH Blog Post or Series 
of Posts) 和 “最 佳 娱 乐 ”( Best Use of DH For Fun), 2 
花 一 现 的 奖项 有 :“ 最 佳 外 语 项 目 ”( Best DH contribu- 
届 , 随 着 非 
英语 资源 的 增多 ,2013 年 后 便 不 再 以 语言 区 分 资源 ; 
“最 佳 资 源 集 ”( Best DH Dataset) 设立 于 2019 - 2020 
年 ,由 于 参与 竞争 的 资源 太 多 ,国际 委员 会 增设 了 该 类 
别 ;“ 最 佳 失 败 案 例 研 究 ”( Best Exploration of DH Fail- 
ure/ Limitations ) Æ 2014 年 设立 ,由 于 没有 足够 的 资源 
参与 苑 选 ,2018 年 起 才 恢 复 该 类 别 评选 。 
012 年 至 今 ， 数 字 人 文 奖 ”累计 评选 出 162 项 获 
品 ,2019 年 是 竞争 最 激烈 的 一 年 ,多 个 资源 打 成 
2 ,其 中 “最 佳 娱 乐 " 中 两 个 资源 并 列 第 一 “最 佳 
博 案 "和 "最 佳 公众 参与 "两 个 资源 并 列 第 三 ;2020 年 
是 提交 资源 最 多 的 一 年 ,共有 124 项 资源 参与 竞选 。 

oZ Ros ,参与 度 最 高 的 国家 是 美国 ,其 次 是 英 
ENS 到 和 意大利 ;近年 来 ,亚太 地 区 ,特别 是 韩国 和 中 
国 矶 极 参与 数字 人 文 实践 ,2020 年 中 国 提交 的 资源 就 
符 人 项 ,可 见 国内 数字 人 文 活动 的 活跃 性 。 从 获奖 机 
构 雪 看 ,英国 的 伦敦 大 学 学 院 (UCL) 数字 人 文中 心 最 
清 短 路 ,开发 的 项 目 分 别 获得 2013 年 的 可 视 化 奖 , 娱 
乐 奖 和 2016 年 的 可 视 化 奖 。 
2E REIR 
人 从 数字 人 文 基础 设施 建设 到 相关 学 科 讨论 ,工具 


tion not in the English language) 只 颁发 过 


一 直 是 数字 人 文 绕 不 开 的 话题 ,甚至 有 学 者 认为 工具 
属性 是 数字 人 文 的 根本 属性 ” ,数字 人 文 未 来 可 能 会 


j” X. The Boston Bombing Digital Archive 和 2016 年 的 
“最 佳 工具 ” 奖 Broken Books。 最 典型 的 免费 开源 的 工 
具 包 是 2013 年 的 冠军 一 一 纽约 市 立 大 学 开发 的 
CBOX ,是 搭建 虚拟 学 术 社 区 和 在 线 学 习 空间 的 工 
具 , 设 置 过 程 直 观 且 文 持 移 动 设 备 的 访问 ,被 很 多 人 文 
学 者 作为 教学 工具 使 用 。2019 年 的 季军 比萨 大 学 开 
发 的 EVT( Edition Visualization Technology ) 是 另 一 款 轻 
量 级 的 开源 工具 ,用 于 从 XML 编码 的 文本 创建 数字 版 
本 ,可 帮助 不 懂 TEI 的 传统 人 文学 者 摆脱 网 络 编程 的 
负担 。 
2.1.2 文本 分 析 类 工具 

人 文 计算 最 早 发 源 于 文学 和 语言 学 ” ,在 线 词 
Ji. 语料库 ,文本 标记 和 翻译 等 工具 是 数字 人 文 工 具 的 
热点 。SHEBANQ(2014 年 冠军 ) 是 希 伯 来 文 的 查询 工 
Ho ;Dantesource( 2015 年 冠军 ) 是 用 RDF 编码 的 但 
T X4E EAGLE (2016 年 冠军 ) 是 提供 古 罗 马 铭文 
的 翻译 软件 ” ;Recogito(2018 年 冠军 ) 是 文本 和 图 像 
标注 工具 ” ; CDO (2019 年 冠军 ) 是 一 款 在 线 词典 工 
上 ,提供 古 埃 及 语 - 科普 特 语 与 德语 、 英 语法 语 互 译 
功能 ”3 ;01d English Online(2020 年 季军 ) 是 帮助 初学 
者 提供 古 英语 发 声 练习 的 在 线 工 具 ™1。 
2.1.3 平台 类 、 综 合 性 的 服务 工具 

近年 来 愈 来 愈 多 的 工具 以 平台 形式 提供 综合 性 服 
务 ,ALCIDE(2015 年 亚军 ) 是 一 个 基于 Web 的 平台 , 集 
合 了 自然 语言 处 理 NPL 的 工具 包 、 可 视 化 工具 等 ,从 
时 间 地理 和 语义 角度 分 析 历 史 文 献 ,方便 学 者 更 有 效 
地 处 理 历史 文本 并 分 享 研究 结果 '”。 美 国 Gale 集团 
开发 的 Digital Scholar Lab (2018 年 亚军 ) 是 一 个 基于 
云 研究 环境 ,将 Gale Primary Sources 数据 库 内 文档 进 
行 OCR 识别 ,并 提供 文本 挖掘 和 可 视 化 的 工具 >， S 3B 


成 为 一 门 辅助 学 科 。“ 最 佳 工具 ”奖项 的 评选 是 最 为 
连续 的 ,凸显 了 数字 人 文 对 人 文学 科 的 文 撑 和 交叉 程 


度 。 按 获奖 的 工具 的 特征 和 类 型 ,大 致 可 分 为 如 下 3 
类 : 
2.1.1 轻 量 级 开源 的 编程 工具 或 内 容 管理 工具 

这 类 工具 具有 开源 、. 易 用 和 技术 门槛 低 的 特点 ,能 
帮助 人 文学 者 快速 搭建 内 容 管理 平台 或 构建 虚拟 学 术 


吉利 亚 理 工大 学 主导 的 Civil War Photo Sleuth ( CWPS ， 
2018 年 季军 ) 平 台 使 用 众 包 机 制 提高 面部 识别 技术 的 
算法 ,标注 照片 中 的 士兵 ,并 将 结果 与 军事 历史 档案 关 
联 , 完 善美 国内 战 历史 数据 ” 。 伦 敦 大 学 学 院 开 发 的 
Transkribus(2019 年 季军 ) 是 一 个 用 于 手稿 识别 和 转录 
的 平台 ,该 平台 提供 的 手写 识别 模型 HTR ,准确 率 达 到 
95% ,支持 专家 管理 个 人 文件 并 导出 文本 ,支持 众 包 项 


空间 。 最 典型 的 轻 量 级 的 内 容 管理 系统 (CMS ) 工具 是 


目 , 利 用 志愿 者 提高 深度 学 习 模 型 ,鼓励 志愿 者 上 传 文 


Omeka ^" ,具备 免费 开源 .使 用 简单 .社区 支持 .功能 

成 且 灵 活 可 扩展 性 的 优势 ,被 广泛 用 于 数字 人 文 项 目 
如 佛罗里达 记忆 项 目 、 迈 阿 密 大 学 的 DLP 项 目 \ 布 法 
罗 城 女性 口述 史 项 目 等 。 很 多 数字 人 文 的 获奖 项 目 和 
平台 都 是 基于 Omeka 搭建 ,如 2012 年 的 “最 佳 公众 参 


村 丰富 平台 资源 P 。 
1.2 最 佳 可 视 化 

可 视 化 一 直 是 数字 人 文 研究 的 热点 ,数字 人 文学 
者 主要 利用 图 像 处 理 ` 计 算 机 虚拟 环境 和 用 户 界面, 旺 
现 数据 分 析 结果 和 项 目 建设 。 有 学 者 分 析 国内 外 数字 
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人 文 研究 主题 领域 的 相关 研究 ,发 现 文本 挖掘 和 可 视 
化 技术 作为 数字 人 文 最 常用 的 研究 手段 经 常 联合 出 
现 ,处 于 数字 人 文 领域 的 核心 第 一 象限 内 。 可 视 化 
作为 通用 技术 往往 穿插 在 整个 项 目 中 ,根据 使 用 阶段 
和 呈现 效果 ,获奖 的 项 目 可 分 为 以 下 4 类型. 
2.2.1 虚拟 现实 重建 

利用 虚拟 现实 技术 VR 和 增强 现实 技术 AR 建立 
虚拟 环境 , 重 现 历 史 场 景 ,包括 重 构 历 史 建 筑 、 模 拟 历 
史 场 景 等 ,构建 三 维 空间 的 虚拟 世界 给 人 文学 者 以 
超越 时 空 的 “场景 再 现 ” 能 力 。2014 年 的 冠军 Virtual 
Paul’ s Cross 项 目 , 利 用 数字 建 模 技术 ,虚拟 重建 了 
17 世纪 初 的 圣保罗 教堂 模型 唱诗 班 以 及 教堂 墓地 
周围 的 建筑 ,为 访问 者 提供 沉浸 式 的 讲 道 体 验 。 
2048 年 德国 柏林 博物 馆 的 Coins 项 目 ,利用 PixiJS,d3 
Reset 将 馆藏 硬币 虚拟 展示 ,并 提供 多 种 交互 方 
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交互 式 地 图 

和 可视化 最 广泛 的 应 用 和 表现 形式 是 将 历史 史料 与 
mm 息 系统 (GIS ) 结 合 , 生 成 时 空 交互 式 地 图 。2012 
AIPUEK ORBIS 项 目 ,模拟 生成 古 罗 马 的 航运 
itg. 根据 用 户 选 择 的 站 点 计算 路 线 .时 间 和 成 本 5 
2013 年 的 Touch History 项 目 也 是 交互 式 地 图 ， 用 户 可 
VIRES ETE 400 多 年 前 的 魁北克 市 进行 旅行 “”。2016 
EREE Peripleo 项 目 利用 关联 数据 技术 ,将 不 同 来 
TG Reo rh f HD E 并 投放 到 不 同时 期 的 动 
态 邮 图 上 ,该 项 目 为 人 文学 者 提供 了 开源 的 历史 地 理 
信息 的 注释 工具 。2019 年 所 有 的 获奖 项 目 都 是 交互 
JBE, Z TIEK Witches 项 目 将 16 世纪 - 18 世 
纪 的 女巫 居住 地 ,审判 和 死亡 地 结合 时 间 轴 制作 了 交 
互 式 地 图 ;法 国 国家 艺术 史 研 究 所 和 卢 浮 宫 合作 ,将 
19 世纪 的 古董 买卖 .价格 等 信息 制作 成 可 视 化 地 图 显 
示 19 世纪 法 国 的 文化 和 社会 历史 ;哈佛 大 学 开发 的 
The Atlas of Economic Complexity 是 一 个 显示 全 球 地 图 

贸易 数据 的 交互 式 地 图 ,成 为 投资 者 和 学 者 探索 全 
球 贸易 动态 的 重要 工具 。 
2.2.3 ”社交 网 络 关系 可 视 化 

基于 人 物 之 间 的 信息 交流 构建 的 社交 关系 网 络 ， 
是 数字 人 文 研究 中 的 另 一 个 可 视 化 方向 , 近 两 年 有 学 
者 开始 将 时 空 和 社交 网 络 结合 ,为 人 文 研究 提供 更 多 
的 视角 。 最 典型 的 获奖 案例 是 Kindred Britain(2013 年 
亚军 ) ,将 英国 3 万 位 历史 名 人 通过 血缘 、 婚 姻 或 其 他 
关系 进行 连接 构成 网 络 显 示 , 从 时 间 、 地 理 、 网 络 关 系 
3 个 维度 宏观 显示 英国 历史 名 人 "1 。 
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2.2.4 语 料 或 史料 的 可 视 化 

文学 研究 中 ,人 文学 者 进行 “ 远 读 "的 方式 是 将 语 
料 可 视 化 ,对 大 规模 文本 内 容 的 可 视 化 主要 分 为 两 类 : 
整体 特征 的 描述 ,如 词 频 统计 的 词 云图 ;和 内 在 结构 特 
征 揭示 ,如 对 历史 小 说 的 体裁 .类 型 .叙事 结构 等 形成 
的 知识 图 谱 。2015 年 冠军 Metaphor Map of English 该 
项 目 基于 牛津 英语 词典 的 历史 版 本 ,显示 不 同 领域 .不 
同时 期 单词 不 同 的 涵义 。2014 年 的 Signs@ 40 项 目 是 
对 Sings 期 刊 40 年 内 发 表 的 论文 的 主题 的 可 视 化 ,展示 
女权 主义 的 研究 主题 随时 间 的 变化 。2017 年 由 佐治 亚 
理工 学 院 开 发 的 The Shape of History 项 目 ,利用 网 格 + 
时 间 轴 的 方式 描述 历史 事件 .颜色 表示 政治 势力 或 事件 
类 型 ,将 历史 事件 转化 为 形状 和 色彩 呈现 出 来 
2.3 最 佳 项 目 / 最 佳 公众 参与 项 目 

数字 人 文 是 大 数据 和 计算 驱动 的 研究 模式 ,无论 
是 基础 设施 建设 还 是 数据 建设 , 仅 靠 单个 机 构 的 投入 
进展 缓慢 ,不 仅 需 要 多 个 文化 遗产 机 构 的 协作 ,而 且 需 
要 公众 参与 到 资源 数据 的 共 建 共享 中 ,实现 数字 人 文 
服务 的 创新 。 按 公众 参与 的 程度 和 内 容 ,可 分 为 4 种 
类 型 : 
2.3.1 转录 校正 文本 

转录 校正 型 是 最 常见 的 公众 参与 项 目 , 主 要 是 手 
稿 .档案 .古籍 的 抄录 或 转录 。 德 克 萨 斯 理工 大 学 的 手 
稿 抄录 项 目 (2013 年 季军 ) .墨西哥 国家 人 类 学 和 历史 
研究 所 的 门 陕 法 典 数字 化 项 目 (2015 EWE) 意大利 
古文 字 学 项 目 (2019 ERE) 都 是 利用 众 包 模式 进行 
的 。 一 些 史料 的 转录 甚至 需要 多 学 科 的 专家 参与 ,如 
2016 年 的 季军 Decoding the Civil War 该 项 目 涉及 美国 
内 战 时 期 的 军用 电报 和 密码 ,需要 具备 专业 知识 的 专 
家 和 学 术 进行 抄录 解读 ” 。 
2.3.2 资源 共 建 

文化 遗产 项 目 资 源 繁多 且 分 散 , 需 要 借助 多 方 力 
量 搜集 资源 。 多 机 构 的 合作 共 建 项 目 如 智利 记忆 
(2017) ,汇集 了 智利 国家 图 书馆 、 国 家 文化 遗产 部 、 博 
物 馆 等 多 家 机 构 的 藏品 。 口 述 历史 项 目 是 较为 常见 的 
资源 建设 方式 ,波士顿 马拉松 人 怒 怖 袭击 档案 (2013) 、 美 
辐 宗 教之 声 项 目 (2019) 都 设 有 口述 历史 小 组 搜集 整理 
档案 。 另 一 种 方式 是 号 召 个 人 上 传 资源 , Archive Alert 
(2017) 为 抢救 濒危 档案 ,号召 公 众 上 传 认 为 重要 的 档 
案 或 史料 。 NumET(2018 ) 辟 励 学 者 上 传 中 世纪 文化 踪 
产 相 关 资 料 。 
2.3.3 标 引 数据 

数据 标 引 类 的 项 目 主要 集中 在 地 图 标记 、 文 献 索 
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引 方 面 。 如 2016 年 的 ToposText 项 目 ” ,召集 学 生 对 
古 希 腊 文 进行 索引 ,并 将 文本 记录 与 地 名 词典 相连 。 
2.3.4 协同 式 知 识 创造 

即 公 众 通 过 社区 互动 .开源 平台 进行 分 布 式 、 协 同 
式 的 知识 创作 。Open a GLAM Lab(2019 ) 是 由 16 位 来 
自 不 同 国家 的 文化 遗产 机 构 的 专家 在 5 天 内 共同 完成 
一 本 书 ;2014 年 的 The American Yawp ^" 和 Encyclope- 
dia of the First World War'“ 项 目 是 汇集 领域 内 上 百 位 
专家 在 线 集体 创作 的 历史 资料 ,这 些 项 目的 实践 展示 
了 在 虚拟 环境 下 ,不 同学 科 的 专家 依托 主题 任务 进行 
探讨 .解释 .表示 和 知识 构建 的 过 程 。 
2.4 最 佳 娱乐 

数字 人 文 项 目 可 以 看 作 是 对 数据 的 创新 开发 使 
膨 3 最 佳 娱乐 奖项 的 设置 副 励 人 文学 者 以 新 颖 、 创 新 、 
有 趣 的 方式 使 用 技术 资源 进行 探索 实践, 某 些 项 目 可 
能 丹 是 学 者 的 灵光 一 现 ,学 术 参 考 价值 不 高 ,但 是 对 次 
具 的 创意 使 用 不 仅 对 其 他 项 目的 开发 有 启示 作 
i 且 可 以 宣传 数字 人 文 。 
015 年 冠军 PAGANS 是 一 个 互动 性 游戏 ,调查 用 
5 四 艺术 作品 相似 性 判断 。 该 游戏 是 对 意大利 的 
VR Verbo Visuale Virtuale ) 项 目 中 的 艺术 作品 而 开发 


à 


的 : 


AP 


-对 集 的 信息 用 于 分 析 用 户 特征 和 艺术 品 特征 之 间 


的 尖 联 性 ,帮助 策 展 人 更 科学 地 建立 展览 路 径 ( 。2016 
HERJE A Generator of Socratic Dialogues 是 机 器 模拟 苏 
榴 后 庆 的 对 话 ,是 机 器 写作 的 有 趣 尝 试 。2019 年 的 伦敦 
全 学 院 开发 的 The Digital Ghost Hunt ,将 编码 教学 . 增 
强 现实 和 现场 融合 在 一 起 ,鼓励 学 生 学 习 编程 。 
2.8) 最 佳 博客 文章 或 系列 文章 

在 数字 学 术 环境 下 ,人 文学 者 越 来 越 多 地 通过 博 
客 .社区 和 网 站 进行 交流 互动 ,分享 和 发 布 研究 成 果 ， 
HER ,博客 等 社交 网 络 成 为 人 文学 者 进行 学 术 传播 和 
交流 的 重要 渠道 , Mepherson 甚至 描述 数字 人 文 为 “ 博 
客人 文 "。 获 奖 博客 网 站 的 作者 和 研究 领域 如 表 2 所 
示 , 从 中 可 以 总 结 出 3 个 特征 :个 人 “单打 独 斗 "到 团 
队 合作 的 转变 ,早期 获奖 的 博客 都 是 个 人 学 者 进行 维 
护 和 更 新 ,2016 年 开始 获奖 项 目 所 有 者 大 多 是 团队 其 
至 是 多 机 构 的 合作 ,类 型 也 不 仅 限于 博客 ,包括 同行 审 
议 的 OA 期 刊 .数字 教程 .专题 网 站 等 ;各 学 科 的 学 
者 关注 点 明显 不 同 :历史 学 家 是 最 为 活跃 的 人 文学 者 
群 ,除了 开通 个 人 博客 发 布 研究 成 果 和 笔记 ,还 合作 搜 
集 .编写 数字 工具 .方法 .开源 程序 的 教程 ;以 英语 专业 
为 代表 的 语言 学 家 主要 关注 建立 同行 审议 的 OA 期 


刊 ;图 书馆 ,档案 馆 或 高 校 的 数字 人 文中 心 主要 通过 数 
字 平 台 宣传 数字 人 文 活 动 .资源 建设 等 内 容 ;@ 团 队 学 
科 背 景 由 单一 到 多 学 科 的 变化 ,发 布 的 内 容 也 不 再 局 
限于 某 个 学 科 领 域 , 而 是 对 更 为 通用 广泛 的 数字 工具 
和 技术 的 记录 和 反思 。 
2.6 最 佳 失败 案例 研究 

该 奖项 是 “数字 人 文 奖 ”最 为 特色 的 部 分 ,委员 会 
设立 奖项 的 目的 是 鼓励 数字 人 文学 者 不 旦 失败 、 不断 
尝试 和 探索 。 创 新 值得 嘉奖 , 带 给 人 文学 者 学 习 和 启 
发 的 失败 经 历 更 值得 鼓励 。 学 者 们 可 以 从 失败 的 实践 
中 吸取 经 验 教 训 , 总 结 项 目 中 出 现 的 问题 并 记录 解决 
方案 ,并 给 相关 从 业者 带 来 反思 和 思考 。 但 是 由 于 提 
名 项 目 较 少 , 只 在 2014 .2018 .2019 .2020 年 颁发 过 4 
届 ,根据 学 者 的 反思 和 总 结 ,数字 人 文 项 目 中 出 现 的 主 
要 障碍 和 问题 可 分 为 如 下 3 类 : 
2.6.1 版 权 政策 问题 

孤儿 作品 是 图 书馆 等 公共 文化 机 构 的 数字 化 项 目 
中 的 资源 黑洞 ,各 国 对 合理 使 用 孤儿 作品 的 法 律 规章 
或 多 或 少 存在 不 足 。M. Terras 在 其 博客 中 记录 了 如 何 
在 英国 政策 变化 不 定 情 况 下 取得 孤儿 作品 的 许可 。 
2.6.2 与 人 文学 者 的 交流 和 团队 协作 问题 

数字 人 文 项 目 聚 集 了 人 文学 者 .图 书馆 员 IT 技术 
ACA S Jr A bà ,团队 成 员 能 和 否 顺畅 沟通 和 取得 共识 
对 项 目 成 效 影 响 巨 大 。 艺 术 人 文 的 网 络 技术 设施 项 目 
Project Bamboo(2008 - 2012) 因 未 能 与 人 文学 者 取得 
紧密 联系 ,而 未 能 构建 成 服务 .社区 为 导向 的 体系 。 
2.6.3 数据 保存 问题 

数字 人 文 项 目 能 否 可 持续 发 展 ,与 数据 的 保存 、 维 
护 息 息 相 关 。C. Barats 等 调研 了 数据 收集 到 传播 的 所 
有 阶段 ,认为 数据 的 长 期 保存 不 仅 考虑 软件 工具、 技 
术 因 素 ,还 要 考虑 人 文 研 究 和 实践 中 的 环境 因素 ,并 从 
数据 访问 .语料库 建立 .数据 分 析 传 播 这 三 方面 探讨 数 
据 保存 方面 的 了 矛盾” 。 


3 ”获奖 项 目 分 析 和 思 


“数字 人 文 奖 ” 的 特色 可 概括 为 : 中 参与 广泛 。 奖 
项 的 提名 不 受 语言 和 地 理 的 限制 ,积极 鼓励 小 语种 地 
区 的 文化 资源 参 选 ,参与 国 遍 布 全 球 ,是 传播 度 最 高 的 
奖项 ;从 2012 年 设立 起 从 未 中 断 ,是 数字 人 文 领域 连 
续 举 办 时 间 最 长 的 奖项 之 一 。@ 公 开 透 明 。 参 与 竞选 
的 作品 的 清单 投票 数 都 公布 在 网 站 上 ,奖项 评选 过 程 
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表 2 最 佳 博 客 获奖 列表 


年 份 名 称 所 有 者 机 构 专业 / 职 ， 类 型 
2012 Digital Humanities Now 多 人 卢森堡 大 学 历史 在 线 出 版 物 
Leonardo Flores; “I Y E-Poetry" L. Flores 阿 帕 拉 契 州立 大 学 英语 学 术 博 客 
is wie c : Re-imagining the Literary Essay for W. Self, et al 小 说 家 文学 家 文学 随笔 评论 
2013 “Psychopower ”of Cultural Diplomacy in the Information N. Grincheva 牛津 大 学 博物 馆 在 线 出 版 物 
Age 


Digital Literary Pedagogy: An Experiment in Process-Ori- 
ented Pedagogy 


R. Whitson, et al 


华威 顿 州立 大 学 。 英语 与 数字 技术 0A 期刊 


The Digital Humanities Is about Breaking Stuff J. Stommel 玛丽 华盛顿 大 学 英语 OA 期 刊 
2014 Six Degrees of Spaghetti Monsters 无 法 访问 
Cork LCBT History O. Egan 档案 学 .社会 学 数字 档案 
The Digital Humanities network on Twitter M. Crandjean 洛桑 大 学 历史 学 术 博 客 
2015 AWOL: The Ancient World Online Blog C. E. Jones 纽约 大 学 历史 源 博客 
Late Antiquity, Digital Humanities, and Musings on the S.E. Bond 爱 荷 华 州 立 大 学 历史 学 术 博 客 
Classical World 
> Digital Humanities on Twitter, a small-world M. Grandjean 洛桑 大 学 历史 学 术 博 客 
x The Programming Historian 多 人 历史 源 教 程 
er Macro-Etymological Analysis of Milton' s Paradise Los J. Reeve 哥伦比亚 大 学 计算 语言 学 学 术 博 客 
e Visionary Cross 无 法 访问 
Cas The Programming Historian en español 多 人 源 教 程 
er The Public Medievalist Special Series; Race, Racism and — 历史 OA 期 刊 
e the Middle Ages 
Co Colonial and Postcolonial Digital Humanities Roundtable R. Risam 塞 勒 姆 州立 大 学 英语 演讲 稿 
EL The British Library' s Digital Scholarship blog 多 人 大 英 图 书馆 图 书馆 博客 
N OpenMethods 多 人 DARIAH-EU 数字 人 文 博客 
~ The Digital Orientalist £X 美国 东方 学 会 数字 人 文 博客 
==2019 The Shiloh Project 多 人 多 个 高 校 宗教 博客 
>< 01Lab (452 Lab) 多 人 南京 大 学 数字 人 文 微 信 公 众 号 
E Center for Digital Humanities at Princeton Updates 多 人 普林斯顿 大 学 图 书馆 。 数字 人 文 网 站 
272020 Ticha Project, 2020 Blog Series 多 人 哈佛 大 学 文化 遗产 数字 浏览 
X Reviews in Digital Humanities J. Guiliano & R. 印第安 纳 大 学 . 塞 勒 “数字 人 文 OA 期 刊 
Q Risam 姆 州立 大 学 


Mapping the Scottish Reformatio 


透明 度 较 高 , 兼 具 公平 性 和 民意 。 从 提名 到 获奖 都 是 
公众 邮件 投票 完成 的 ,获奖 的 唯一 依据 是 选票 数 ,委员 
会 负责 筛选 有 效 投票 ,避免 重复 投票 。 名 奖项 设置 灵 
活 全 面 。 涵 盖 数 字 人 文 相关 的 工具 、 项 目 文章 等 多 个 
方面 ,并 根据 每 年 充 选 资源 的 数量 和 内 容 来 调整 奖项 
设置 ,如 2020 年 设置 的 “新 冠 专项 ”( Special Category: 
Best DH Response to COVID-19) , 既 能 体现 该 奖 的 创新 
性 和 实用 性 ,也 能 反映 当年 数字 人 文 的 热点 。 

但 是 由 于 没有 奖金 激励 , 且 没 有 专业 学 会 的 支持 ， 
“学 院 派 " 对 其 认可 度 不 高 ,诸如 书信 共和 国 ( Republic 
of Letters) “威尼斯 时 间 机 器 ”( Venice Time Machine) 
等 知名 项 目 都 没有 参与 其 中 ,可 见 该 奖项 更 多 地 是 娱 


M. D. Brock & C. R. 
Langley 


华 万 顿 与 李 大 学 
(W&L 大 学 ) , 25? 
大 学 

乐 性 和 宣传 性 。 从 获奖 的 结果 来 看 ,很 多 有 影响 力 的 
工具 如 Markus 哈佛 中 国 历代 人 物 传记 资料 库 ( China 
Biographical Database, CBDB) .文本 编码 倡议 (Text En- 
coding Initiative ,TEI) 等 并 未 获得 理想 名 次 ,而 有 些 获 
得 名 次 的 项 目 或 工具 因为 各 种 原因 已 停止 更 新 或 继续 
开发 ,如 Textal(2013 年 的 “最 佳 娱乐 项 目 ” 的 亚军 ) 最 
近 更 新 是 在 2014 年 , Checklist for Digital Humanities 
Projects (2017 年 “最 佳 工具 ”冠军 ) 因 资 源 迁 移 而 无 法 
访问 。 从 评选 标准 和 维度 来 看 ,作品 能 否 获奖 的 唯一 
指标 是 网 络 选票 ,评价 维度 较为 单一 ,投票 途径 只 能 通 
过 谷歌 表单 ,欧美 以 外 地 区 特别 是 国内 访问 网 址 和 投 


历史 学 . 近 现 代 史 。 可 视 化 


票 有 一 定 障碍 ,因此 获奖 结果 缺乏 一 定 的 专业 性 和 客 
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观 性 ;项 类 目 设置 不 统一 ,奖项 的 权威 性 和 稳定 性 也 稍 
显 不 足 。 

纵览 获奖 项 目的 内 容 和 建设 模式 ,可 以 发 现 其 具 
有 如 下 特征 :很 多 获奖 项 目的 选 题 角度 较 小 而 新 颖 ， 
但 是 专业 性 强 , 如 2019 年 的 最 佳 可 视 化 获奖 项 目 “ 苏 
格 兰 女巫 的 可 视 化 地 图 ” ,将 女巫 的 居住 地 死亡 地 以 
关联 数据 发 布 并 制作 交互 式 地 图 。“ 小 而 精 ” 的 方式 
受到 近年 来 学 者 的 青睐 ,特别 是 对 缺少 团队 支撑 、 项 目 


短缺 等 原因 而 终止 。 造 成 数字 人 文 项 目 失败 的 原因 很 
多 ,比如 资金 短缺 .技术 过 时 、 人 员 流 动 等 ” ,还 有 部 
分 早期 建设 的 数据 集 和 项 目 因 资 源 迁 移 、 数 据 格式 选 
择 错误 等 原因 而 无 法 访问 ,因此 在 数字 人 文 项 目的 立 
项 阶段 就 要 考虑 到 可 持续 发 展 问题 ,将 生命 周期 管理 
和 后 续 维 护 等 问题 纳入 项 目 规划 和 建设 目标 中 。 


4 总 结 和 建议 


处 于 起 步 阶段 的 个 人 学 者 而 言 ,这 种 方式 更 有 助 于 提 
高 成 功率 。@ 社 会 性 议题 .资源 建设 类 的 项 目 ,借助 公 
众 力量 成 为 一 种 趋势 ,社会 公众 与 专家 BOR ACA ,高 
校 师 生 共同 参与 到 数字 人 文 项 目的 建设 .运营 和 传播 ， 
从 资料 搜集 ,数据 清洗 .资金 支持 到 传播 分 享 。@ 数 字 
全 项 目的 可 持续 发 展 成 为 重要 议题 。 从 调研 中 发 现 
很 多 获奖 项 目 已 停止 运营 维护 ,如 在 2012 年 .2014 年 
AGBH Project Bamboo 项 目 因 缺 乏 人 文学 者 参与 .资金 


4.1 数字 人 文 技术 总 结 

言 息 技 术 是 人 文 研究 范式 革新 最 重要 的 驱动 ,， 数 
字 人 文 的 技术 体系 可 分 为 :数字 化 技术 数据 管理 技 
术 .数据 分 析 技 术 可视化 技术 、VR 技术 和 机 器 学 习 技 
术 。 本 文 基于 获奖 的 数字 人 文 项 目 和 工具 ,归纳 了 目 
前 在 数字 人 文 领 域 应 用 最 广泛 的 信息 技术 ,如 表 3 所 
7: 


< 二 表 3 获奖 资源 核心 技术 

© 资源 名 称 内 容 类 型 主要 技术 

e Recogito 语义 标注 工具 工具 VIF .关联 数据 .GIS 

Transkribus 文档 转录 平台 工具 AI 机 器 学 习 、 大 数据 

Co Livingstone' s 1870 Field Diary 利文 斯 通 冒 险 日 记 数据 集 光谱 成 像 技 术 

CN Kindred Britain 英国 各 人 家 谱 可 视 化 网 络 可 视 化 技术 

e Tudor Networks 书信 网 络 可 视 化 项 目 社交 网 络 分 析 , 可 视 化 
Lr DanteSources 但 丁 文集 工具 RDF 本 体 

a Nous Dus 报纸 数据 集 项 目 机 器 学 习 

>< Gale Digital Scholar Lab 数字 人 文 实验 室 工具 文本 分 析 .关联 数据 
(9 DARIAH 艺术 人 文 数字 基础 设施 项 目 关联 数据 .GIS 

K= COVID19 Cartography 可 视 化 论文 可 视 化 自然 语言 处 理 算法 
- Animal Crossing 虚拟 空间 可 视 化 VR 


- 


表 3 列举 了 部 分 获奖 资源 和 主要 技术 ,资源 描述 
HEZE (RDF) .本体 .关联 数据 和 国际 图 像 互 操作 框架 
(International Image Interoperability Framework ,IIF ) 主 
要 用 于 数据 的 组 织 ,文本 分 析 和 挖掘 技术 .光谱 成 像 技 
术 自然 语言 处 理 、. 社 交 网 络 分 析 算 法 、 机 噩 学习 等 Al 
技术 主要 用 于 数据 的 处 理 , 地 理 信息 系统 (GIS) .虚拟 
现实 (VR) \ 增 强 现实 (AR) 混合 现实 (MR ) 等 技术 主 
要 用 于 数据 的 展示 和 呈现 。 有 学 者 认为 RDF .关联 数 
据 IF、 大 数据 和 Al 是 数字 人 文 项 目 建设 的 通用 技术 
框架 ,RDF „TEI, SGML, IIF 等 通用 标准 ,定义 了 数据 、 
文档 、 图 像 的 描述 、 组 织 和 呈现 标准 ,使 得 数字 人 文 底 
层 资 源 实 现 统一 融合 ; AI 技术、 算法 模型 社会 分 析 、 
机 器 学 习 等 技术 用 在 文本 挖掘 和 图 像 处 理 方面 , 对 人 
文 资源 进行 重 塑 和 改造 ; 越 来 越 多 学 者 借助 GIS, AR 
等 技术 对 研究 结果 进行 可 视 化 展示 ,促进 人文 知识 的 


传播 理解 和 创新 。 当 然 ,也 应 该 看 到 ,技术 并 非 一 成 
不 变 , 数 字 人 文 的 技术 框架 也 是 出 于 不 断 发 展 、 更 新 
中 ,同时 ,技术 也 没有 好 坏 之 分 ,在 明确 项 目 特点 和 应 
用 需求 后 选择 合适 的 技术 才 是 好 技术 。 
4.2 ”数字 人 文 工 具 开 发 建议 
人 文学 者 往往 是 在 使 用 数字 工具 中 接受 数字 人 文 

并 推动 数字 人 文 的 发 展 ,从 某 种 程度 上 说 ,数字 人 文 首 
先是 一 种 技术 工具 ,在 解决 传统 人 文 研 究 问题 的 过 程 

,影响 人 文学 者 的 研究 范式 和 路 径 。 尽 管 在 数字 人 文 
基础 设施 和 工具 上 已 经 投入 了 大 量 资金 ,但 是 只 有 6% 
的 人 文学 者 在 研究 中 使 用 数字 资源 和 工具 ”。 有 学 者 
指出 ,数字 工具 需要 更 先进 的 技术 、 更 强大 的 功能 才能 
吸引 人 文学 者 的 使 用 。 但 从 获奖 结果 来 看 ,最 受 人 文学 
者 好 评 的 工具 并 非 是 集成 了 最 先进 的 技术 最 复杂 的 功 
能 。 从 获奖 工具 的 共性 中 ,给 工具 开发 商 提供 如 下 建议 ; 
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4.2.1 轻 量 开源 ,社区 支持 
无 论 是 内 容 管理 工具 OMKEA 可 视 化 工具 EVT 
还 是 标注 平台 Recogito ,这 些 工 具 都 是 开源 免费 使 用 ， 
遇 于 轻 量 级 应 用 软件 ,部 署 方便 技术 门槛 低 。 虽 然 数 
字 人 文 课 程 有 意识 地 培养 人 文学 者 的 数字 素养 和 基本 
程 能 力 ,但 大 部 分 人 文学 者 对 编程 是 零 基 础 的 ,因此 
工具 的 使 用 需要 低 门 槛 ,让 研究 人 员 在 不 懂 技 术 知 识 
的 前 提 下 也 可 以 操作 工具 。 活跃 的 用 户 社区 是 工具 成 
功 运行 的 男 一 个 重要 因素 ,该 社区 可 以 是 系统 开发 交 
流 的 平台 如 依托 Github , Trello 的 任务 交流 ,也 可 以 是 
用 户 使 用 互动 的 平台 。 开 源 社区 不 仅 能 保证 工具 版 本 
的 更 新 和 功能 完善 ,还 可 以 为 人 文学 者 提供 技术 支持 。 
4.2.2 界面 友好 ,功能 易 用 
本 有 些 工具 的 界面 虽然 简陋 ,但 是 用 户 所 见 即 所 需 ， 
人 line Coptic Dictionary 为 例 ,其 界面 简洁 ,功能 显示 
直观 ,人 文学 者 甚至 依靠 直觉 就 可 以 使 用 。 近 两 年 工 


EID 


和 请 入 集成 化 平台 化 发 展 趋势 ,工具 构建 者 需要 在 设 


条 开发 中 考虑 用 户 界面 的 灵活 性 和 清晰 性 ,隐藏 部 
众生 常用 功能 ,与 用 户 形成 高 效 互动 。 正 如 一 位 历史 
学 过 评论 说 , 易 用 的 工具 可 以 让 学 者 更 集中 研究 问题 
办 车, 避免 在 探索 功能 和 操作 上 浪费 时 间 '” 。 

4T% 加 强 工具 培训 ,重视 用 户 文档 的 编写 

很 多 人 文学 者 对 数字 工具 缺乏 了 解 ,包括 原理 , 操 
作案 例 等 ,因此 对 工具 有 “不 信任 " 感 ,因此 有 学 者 呼 
叶 曾 该 重视 工具 的 推广 ,例如 培养 .传授 对 数据 的 分 
i ele MARERE. Cale 数字 学 术 实 验 室 在 高 校内 
开 胡 培训 讲座 ,因此 获得 人 文学 者 的 好 评 。F. Gibbs 的 
实 琢 调研 "” 表明 ,很 多 人 文学 者 在 阅读 了 工具 的 文档 
之 后 ,无 法 完全 理解 工具 对 其 研究 的 帮助 ,因此 建议 用 
户 文档 包含 工具 的 基础 知识 .具体 实例 以 及 研究 方法 。 
文本 标注 工具 Markus 就 是 很 好 的 例子 ,该 平台 上 有 详 
细 的 操作 步骤 演示 动画 以 及 案例 分 享 。 

4.2.4 ”以 人 文学 者 需求 为 导向 ,与 人 文学 者 建立 密切 
联系 


要 ,工具 开发 者 应 该 和 数据 存储 机 构 、 其 他 工具 合作 ， 
或 励 不 同 格式 、 标 准 的 兼容 ,支持 数据 的 互 操 作 性 。 
Markus 从 原本 的 文本 标注 工具 发 展 为 具有 多 功能 的 阅 
读 和 文本 分 析 平 台 ,集成 了 多 个 参考 工具 和 编辑 器 , 支 
TF GIS CBDB 进行 数据 共享 。 

4.3 数字 人 文 项 目 开 发 建议 

数字 人 文 是 一 个 涉及 多 学 科 合 作 的 研究 领域 , 具 
有 研究 工作 量 大 、 经 费 有 限 . 跨 学 科 合作 的 特点 。 众 包 
模式 利用 开放 式 参 与 和 群体 智慧 ,进行 人 文 数据 的 收 
集 、 处 理 和 分 析 , 是 解决 数字 人 文 项 目 中 数据 短缺 的 最 
优 方 式 。 目 前 数字 人 文 项 目的 前 端 建设 将 越 来 越 多 地 
采用 众 包 模 式 ,促进 数字 人 文 基础 设施 建设 。 

从 失败 的 项 目 实践 来 看 ,数字 人 文 项 目 有 两 个 挑 
战 性 :项 目的 可 持续 和 数据 的 可 访问 性 。 大 部 分 项 目 
都 存在 资金 短缺 ,甚至 因为 没有 后 续 基 金 支持 而 导致 
网 站 无 法 访问 。 对 于 资金 .资源 受 限 的 小 型 数字 人 文 
项 目 ,A. Gil 提出 了 “最 小 计算 ”的 项 目 实 践 模式 , 即 在 
硬件 .软件 .网 络 容 量 受 限 的 环境 下 ,以 “最 优 配置 ” 
“最 小 维护 量 ” 和 “最 小 消耗 量 ” 来 构建 数字 人 文 项 
目 ”。 具 体 准则 包括 :用 离散 的 、. 轻 量 级 组 件 来 构建 
项 目 框 染 ,如 采用 微服 务 架 构 组 件 封装 、 代 码 模块 化 
等 方式 来 增强 程序 的 灵活 性 和 可 扩展 性 ;尽量 使 用 通 
用 的 标准 定义 数据 ,如 使 用 W3C 标准 关联 数据 进行 
数据 发 布 ,增加 对 资源 内 容 的 访问 和 数据 的 重用 性 ; 降 
低 对 工具 数据库 和 软件 的 依赖 ,减少 资源 需求 和 处 理 
时 间 ;减少 使 用 专业 术语 ,尽量 使 用 通用 语言 增加 对 共 
同文 化 的 参与 ,例如 领域 专家 和 开发 人 员 一 起 创建 通 
用 语言 ,通过 团队 交流 简单 清晰 地 传递 业务 规则 ,增强 
项 目的 可 维护 性 。 


5 结语 


Sn 


通过 纵向 比较 “数字 人 文 奖 ” 的 获奖 资源 ,可 以 回 
顾 数字 人 文 的 应 用 脉络 :中 从 工具 角度 来 看 ,早期 数字 
人 文 应 用 聚焦 于 文本 内 容 管理 ,文本 编码 等 文本 处 理 


以 史学 为 例 ,历史 地 理 是 较 早 引入 数字 技术 的 领 
域 , 很 时 引入 统计 分 析 软 件 并 建立 数据 库 ,但 对 具体 研 
究 问 题 来 说 ,需要 “ 量 身 定做 "的 工具 ,比如 古今 地 图 
TEIL EE Tg Po PH HYPE. E ACRES 
切 联系 ,推动 我 们 思考 结合 研究 对 象 和 主题 的 特性 , 开 
发 针对 性 的 数字 人 文 工 具 。 
4.2.5 开放 数据 接口 ,集成 工具 平台 ,为 用 户 提 供 一 
站 式 的 服务 

随 着 数字 基础 设施 的 完善 ,数据 标准 化 越 来 越 重 


方面 ,学 科 交 叉 不 断 深 入 ,加 入 了 地 理 、 时 空 等 维度 的 
内 容 标注 , 随 着 数字 人 文 方法 论 和 学 术 共同 体 的 的 构 
建 完善 ,以 Transkribus 为 代表 的 软件 不 仅仅 是 一 个 工 
具 , 同 时 也 为 学 者 构建 了 一 个 虚拟 和 开放 的 研究 环境 
甚至 是 知识 生产 系统 。@) 从 学 科 应 用 领域 来 看 ,数字 
人 文 的 学 科 应 用 随时 间 的 推移 不 断 深入 ,语言 学 和 历 
史学 未 来 仍 是 数字 人 文 应 用 的 主要 学 科 , 艺术、 宗教 神 
学 女权 主义 哲学 后 殖民 主义 等 社会 人 文学 科 的 应 用 
频次 也 在 逐渐 提升 ,同时 学 科 的 交叉 和 融合 的 特征 更 
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为 明显 ,学 者 间 的 跨 界 交流 合作 加 强 , 这 种 变化 趋势 在 

博客 文章 中 尤为 明显 。@@ 从 数字 资源 角度 来 看 ,特色 

资源 和 “冷门 绝学 ”的 研究 更 容易 获得 奖项 青睐 ,如 对 

彩虹 群体 的 研究 .小 众 语言 或 文化 的 资源 集 、 后 殖民 主 

义 的 思考 等 ,说 明 只 要 找 准 题材 .定位 ,具有 文化 传承 

和 研究 价值 , “小 项 目 ” 也 能 获奖 。 通 过 对 “数字 人 文 

奖 ” 获 奖 资源 的 研究 ,本 文 对 数字 人 文 的 工具 项 目 进 

行 梳理 和 分 析 , 并 对 数字 人 文 工 具 的 开发 .项 目 建 设 提 

出 建议 ,在 未 来 的 研究 中 ,还 需要 对 数字 人 文 的 实践 进 

行 更 广泛 的 收集 和 分 析 , 以 探索 数字 人 文具 体 发 展 状 

况 。 
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Abstract: | Purpose/significance | In the field of international digital humanities, Digital Humanities Award is 


XIV 


e£ of the most authoritative awards. Through combing and analyzing the award-winning projects, the commonalities 
between "excellent projects" and “ practical tools" in the field of digital humanities can be found, and the shortcom- 
dnps of failed projects can be summarized. | Method/ process | This paper used literature research method , content 
Ginalysis method and information measurement method to sort out the award-winning projects of Digital Humanities A- 
ward over the years, and summarized the characteristics and deficiencies of the award-winning projects. | Result/ 
conclusion | After investigation and analysis, this article proposes that the digital humanities tool development should 
be oriented towards code open source and user needs; project practice should be based on linked data, international 
image interoperability framework (IIF) , resource description framework ( RDF) and artificial intelligence technology 
( AI) as the main technical framework ; these projects with limited funds or resources can choose "minimum compu- 
ting" as the practice mode. 


Keywords: Digital Humanities Awards tool development technology realization ^ minimal computing 
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